虚拟变量(哑变量):在统计学、计量经济学与回归分析中,用 0/1(或一组0/1) 来表示类别信息的变量,用于把“性别、地区、是否参加、政策前后”等定性特征纳入模型比较不同组之间的差异。(也常见扩展:用多个虚拟变量表示多类别;需注意“虚拟变量陷阱/共线性”。)
/ˈdʌmi ˈvɛriəbəl/
A dummy variable equals 1 if the customer is new, and 0 otherwise.
如果顾客是新客户,虚拟变量取 1;否则取 0。
To control for regional differences, the model includes dummy variables for each city, with one city omitted as the reference group.
为控制地区差异,模型为每个城市加入虚拟变量,并省略一个城市作为参照组。
dummy 原意有“假人/仿制品、代用品”的含义,在统计语境中引申为“用来代替类别信息的占位符”;variable 来自拉丁语词根 *vari-*(“变化”)。合起来表示“用数值形式代替类别差异的变量”。“哑变量”这一中文译名强调它本身不直接“说出”具体类别,而是用 0/1 编码来表达。